首页> 外文OA文献 >DC-Prophet: Predicting Catastrophic Machine Failures in DataCenters
【2h】

DC-Prophet: Predicting Catastrophic Machine Failures in DataCenters

机译:DC-prophet:预测DataCenters中的灾难性机器故障

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。
获取外文期刊封面目录资料

摘要

When will a server fail catastrophically in an industrial datacenter? Is itpossible to forecast these failures so preventive actions can be taken toincrease the reliability of a datacenter? To answer these questions, we havestudied what are probably the largest, publicly available datacenter traces,containing more than 104 million events from 12,500 machines. Among thesesamples, we observe and categorize three types of machine failures, all ofwhich are catastrophic and may lead to information loss, or even worse,reliability degradation of a datacenter. We further propose a two-stageframework-DC-Prophet-based on One-Class Support Vector Machine and RandomForest. DC-Prophet extracts surprising patterns and accurately predicts thenext failure of a machine. Experimental results show that DC-Prophet achievesan AUC of 0.93 in predicting the next machine failure, and a F3-score of 0.88(out of 1). On average, DC-Prophet outperforms other classical machine learningmethods by 39.45% in F3-score.
机译:服务器何时会在工业数据中心发生灾难性的故障?是否有可能预测这些故障,以便采取预防措施来提高数据中心的可靠性?为了回答这些问题,我们研究了可能是最大的公开数据中心跟踪,其中包含来自12,500台计算机的1.04亿个事件。在这些样本中,我们观察并分类了三种类型的机器故障,所有这些都是灾难性的,并且可能导致信息丢失,甚至导致数据中心的可靠性下降。我们进一步提出了基于一类支持向量机和RandomForest的两阶段框架-DC-先知。 DC-Prophet提取令人惊讶的模式并准确预测机器的下一次故障。实验结果表明,DC-Prophet在预测下一台机器故障时的san AUC为0.93,F3分数为0.88(满分1)。在F3评分中,DC-Prophet平均优于其他经典机器学习方法39.45%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号